Diese Folie ist absichtlich leer!
In [1]:
%matplotlib inline
import pandas as pd
Sehr große Auswahl == sehr große Möglichkeiten?
Individuelle Systeme == Individuelle Probleme => Individuelle Analysen => Individuelle Erkenntnisse!
"Statistics on a Mac."
=> Belastbare Erkenntnisse mittels Fakten liefern
=> Neue Erkenntnisse verständlich herausarbeiten
In [ ]:
"100" == max. Beliebtheit!
Nicht so weit weg wie gedacht!
=> von der Frage über die Daten zur Erkenntnis!
Vehikel: Computational notebooks
Meta-Ziel: Grundmechaniken kennenlernen.
Wir laden einen Datenexport aus einem Git-Repository.
In [ ]:
Wir sehen uns Basisinfos über den Datensatz an.
In [ ]:
1 DataFrame (~ programmierbares Excel-Arbeitsblatt), 6 Series (= Spalten), 1128819 entries (= Reihen)
Wir wandeln die Zeitstempel von Texte in Objekte um.
In [ ]:
Wir sehen uns nur die jüngsten Änderungen an.
In [ ]:
Wir wollen nur Java-Code verwenden.
In [ ]:
Wir zählen die Anzahl der Änderungen je Datei.
In [ ]:
Wir holen Infos über die Code-Zeilen hinzu...
In [ ]:
...und verschneiden diese mit den vorhandenen Daten.
In [ ]:
Wir zeigen nur die TOP 10 Hotspots im Code an.
In [ ]:
Wir erzeugen ein XY-Diagramm aus der TOP 10 Liste.
In [ ]:
https://www.feststelltaste.de/category/top5/
Kurse, Videos, Blogs, Bücher und mehr (im Aufbau).
https://github.com/feststelltaste/software-analytics-workshop
=> von der Frage über die Daten zur Erkenntnis!